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摘要 : 【 目的 】 研究 建立 网 络 外 包 环 境 下 的 任务 知识 需求 模型 构建 方法 。[ 应 用 背景 ] 将 任务 所 需 的 知识 模型 构 
建 方法 应 用 于 网 络 外 包 平 台中 , 为 任务 和 人 才 的 在 线 匹 配 进行 服务 。[ 方法 ] 设计 专家 系统 框架 , 构建 任务 的 描 
述 模 型 ， 进 而 分 别 基于 推理 规则 和 文本 分 析 技 术 对 任务 进行 解析 ,以 量化 方式 获取 任务 的 知识 需求 。[ 结果 】 通 
过 案例 验证 该 系统 框架 的 建 模 方法 具有 良好 的 效果 ,能 够 准确 地 获取 网 络 外 包 任务 的 知识 需求 模型 。[ 结论 】 本 


研究 设计 的 任务 知识 需求 建 模 方法 能 够 为 网 络 外 包 的 任务 和 人 才 匹 配 打 下 基础 。 
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1 3 引 


自 2003 年 美国 学 者 Chesbrough 提出 开放 式 创新 概 
念 以 来 ， 随 着 网 络 通讯 设施 的 迅速 发 展 和 信息 技术 的 
日 新 月 异 ， 网 络 环境 下 的 创新 外 包 成 为 一 种 新 兴 模 
式 口 。 网 络 创新 外 包 能 够 通过 互联 网 向 全 社会 扩散 , 让 
更 多 的 人 才能 够 参与 到 市 场所 需 的 创新 工作 中 。 如 今 ， 
国内 外 的 网 络 外 包 服 务 平台 的 发 展 迅 速 ， 比 如 国外 的 
InnoCentive.com InnovationExchange.com \ TopCoder.com 
等 外 包 网 站 ,有 的 以 技术 和 知识 创新 为 主 有 的 以 软件 
定制 为 主 中 ; 而 国内 则 有 猪八戒 威 客 网 .任务 中 国 等 网 站 
提供 网 络 化 的 外 包 服 务 口 。 在 这 种 服务 模式 下 , 组 织 通过 
联系 外 部 的 知识 和 内 部 的 研发 ， 实 行 开放 式 创 新 策略 ， 
创造 出 更 多 价值 的 同时 进一步 促进 组 织 技 术 的 发 展 , 在 
时 间 和 成 本 最 小 化 的 前 提 下 实现 利益 最 大 化 。 对 于 网 络 
外 包 任务 来 说 , 涉及 的 类 型 多 种 多 样 ， 比 如 从 外 包 方 式 
角度 分 为 流程 外 包 、 产 品 外 包 、 设计 外 包 等 外 ,又 如 从 任 
务 目 标 角 度 分 为 问题 求解 、 创 意 设 计 、 科 学 研究 、 咨 询 
服务 及 软件 开发 等 ,而 各 类 外 包 任 务 更 是 覆盖 各 行 各 
业 。 各 行业 领域 的 技术 人 才 构 成 了 网 络 创新 外 包 模 式 中 


了 中 


可 利用 的 重要 外 部 创新 力量 , 为 各 类 企业 和 组 织 解决 
创新 型 的 难题 提供 最 有 利 的 外 部 环境 ,作为 网 络 外 包 
模式 的 重要 参与 者 , 更 高 效 合理 地 为 企业 创造 价值 中 。 然 
而 ,网络 外 包 服 务 也 面临 着 一 系列 现实 问题 ,其 中 如 何 
为 大 量 不 同类 型 的 任务 和 组 织 高 效 地 找到 最 合适 的 人 
才 是 当前 急需 解决 的 要 务 中 ,这 就 需要 根据 任务 的 需求 
寻找 和 匹配 具备 相应 知识 背景 和 能 力 的 人 才 。 

本 文 设计 专家 系统 框架 , 结合 基于 规则 的 推理 和 
文本 分 析 技 术 , 以 任务 和 专业 知识 之 间 关 系 的 角度 分 
析 和 探讨 网 络 外 包 任 务 所 需要 的 人 才 应 具备 的 专业 背 
景 和 知识 结构 。 构 建 任务 描述 模型 ,使 网 络 外 包 需 求 
能 够 规范 化 地 表达 任务 需求 ; 进而 通过 研究 任务 与 专 
业 知识 之 间 的 关联 关系 ,为 任务 筛选 合适 的 专业 课程 
需求 ,构建 网 络 外 包 任 务 的 知识 需求 模型 。 本 文 提供 
的 模型 构建 方法 ,为 任务 -人 才 的 匹配 奠定 基础 。 


2 研究 背景 


目前 对 于 任务 模型 领域 的 研究 主要 集中 在 结构 化 
的 任务 需求 领域 。 例 如 软件 工程 中 程序 需求 的 确定 和 
产品 开发 任务 中 的 模块 化 产品 参数 的 描述 。 这 些 任务 
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由 于 具有 特定 的 结构 ,可 以 采用 结构 化 的 方式 进行 描 
述 。 而 对 于 非 结构 化 的 任务 , Duursma 等 研究 任务 的 基 
本 属性 构成 以 及 任务 模型 构建 方法 , 该 任务 模型 主要 
探讨 任务 的 基本 内 容 和 任务 的 分 解 、 子 任务 的 描述 等 
方面 , 采用 层次 化 的 结构 来 描述 任务 外 。Van Der Aalst 
研究 了 在 商业 过 程 分 析 中 任务 模型 的 作用 ,主要 包括 
模型 的 设计 阶段 和 商业 过 程 的 检测 阶段 中。Traetteberg 
主要 研究 工作 流 的 任务 模型 构建 , 通过 任务 模型 对 工 
作 流 进行 分 解 、 分 析 , 并 提出 优化 工作 流 的 建议 C9。 
王楠 等 提出 基于 广义 知识 重 构 与 抽象 的 模型 ， 该 模型 
结合 任务 构建 的 模型 对 工作 流 建 模 的 一 般 过 程 进行 描 
述 , 生成 工作 流 简化 模型 和 抽象 模型 中 。Eichholz 等 
研究 任务 模型 的 基本 定义 ,并 人 研究 在 小 组 合作 的 基础 
上 任务 模型 的 定义 0。O"Neill 研究 任务 模型 的 表述 方 
法 , 在 沟通 与 合作 的 模型 下 对 任务 描述 模型 设计 一 套 
基本 方法 中 。 然 而 ,网络 外 包 任 务 具 有 多 种 类 、 多 行 
业 的 复杂 特征 , 不 同 任务 之 间 、 不 同 项 目 对 于 相同 任 
务 之 间 的 需求 差异 很 大 ， 目 前 对 于 任务 需求 所 提出 的 
各 类 模型 并 不 能 全 面 地 表达 一 个 特定 的 任务 , 而 任务 
的 非 结 构 特 征 也 导致 很 难 用 一 种 固定 的 结构 化 模型 对 
任务 的 需求 进行 表达 。 

对 于 任务 需求 所 对 应 的 知识 结构 方面 的 相关 研 
究 ，Winterton 等 总 结 知识 是 学 习 能 力 与 学 习 机 会 交互 
构造 的 结果 , 包括 基础 理论 和 概念 ， 以 及 根据 完成 特 
定 任务 所 获得 的 经 验 性 信息 站。 李 梓 房 在 其 著 书 中 提 
出 ,完成 一 件 任务 所 需要 具备 的 知识 结构 由 基本 理 
论 、 基 础 知识 、 专 业 基础 知识 、 专 业 知识 、 学 科 知 识 、 
学 科 前 沿 知识 构成 由。Johnson 等 提出 任务 知识 模型 
的 构建 方法 和 知识 分 解 方 法 , 并 使 用 技术 手段 进行 任 
务 特 征 的 提取 59。 目 前 关于 任务 的 知识 需求 已 有 研究 
主要 集中 于 知识 结构 的 定性 表述 , 而 对 任务 知识 需求 
的 自动 化 推理 和 量化 建 模 方法 较为 缺乏 ,同时 对 于 任 
务 需求 与 知识 的 关联 关系 研究 也 不 够 全 面 。 

综 上 所 述 , 本 研究 提出 任务 描述 模型 和 知识 需求 
的 构建 方法 ， 主 要 是 为 了 确定 网 络 外 包 任 务 所 需要 的 
专业 知识 背景 。 任 务 的 知识 需求 是 一 个 较 广泛 的 概念 ， 
体现 在 任务 的 目标 、 行 业 以 及 描述 中 , 这 就 需要 对 网 络 
外 包 任 务 的 需求 以 半 结 构 化 的 形式 进行 描述 ,进而 以 
规则 推理 与 文本 分 析 相 结合 的 技术 对 任务 描述 模型 进 
行 解析 , 最 终 以 量化 的 方式 获得 任务 的 知识 需求 。 


3 ”模型 构建 过 程 


本 文 围绕 任务 的 知识 需求 模型 构建 问题 设计 系统 
框架 如 图 1 所 示 : 


任务 发 布 与 描述 模型 构建 


基于 文本 分 析 的 解析 


基于 规则 的 推理 


任务 课 各 需求 向 
| 
任务 的 专业 背景 分 析 ES 
任务 的 知识 需求 模型 | 


图 1 网 络 外 包 任 务 的 知识 需求 建 模 系统 框架 

网 络 外 包 任 务 的 知识 需求 包括 任务 对 具备 一 定 专 
业 背 景 和 学 过 相关 专业 课程 的 人 才 的 需求 。 为 解决 网 
络 外 包 任 务 的 知识 需求 模型 构建 问题 , 本 文采 用 专家 
系统 的 设计 科学 研究 方法 41 旨 在 为 发 布 的 任务 建立 
描述 模型 ， 进而 基于 规则 推理 和 文本 分 析 对 任务 的 课 
程 需求 进行 量化 建 模 ,并 在 此 基础 上 对 任务 所 涉及 的 
专业 背景 进行 解析 ,建立 任务 的 知识 需求 模型 ， 从 而 
为 网 络 外 包 的 任务 -人 才 匹 配 打下 基础 。 
3.1 任务 发 布 与 描述 模型 构建 

设计 系统 的 任务 数据 库 , 结合 网 络 化 外 包 任 务 的 
特点 并 借鉴 现 有 的 软件 行业 需求 表述 方法 , 将 任务 需 
求 进 行 分 段 式 模 型 化 描述 , 数据 库 设 计 如 表 1 所 示 : 

表 1 系统 任务 数据 库 设计 


字段 名 简 述 字段 用 途 及 主要 约束 
Task ID 王 务 ID 
Task Name 王 务 名 称 
全 涵 音 任 基本 信息 ， 
Task_StartDate ”任务 发 布 时 间 ns 0 m 
Task EndDate 王 务 结束 时 间 入 
Task Reward 王 务 悬赏 金额 


ee 记录 任务 前 提 依据 的 
Task_Input 王 务 输入 条 件 附件 ,可 为 空 
定义 任务 涉及 的 种 类 

Task_ Type 王 务 类 型 ee 领域 
Task_ Output 王 务 目 标 及 产 出 成 果 和 08 
Task_Executor ”执行 者 职能 A 

ee 文本 形式 记录 任务 的 
Task_Description 任务 内 容 描 述 详细 需求 内 容 


任务 发 布 过 程 采 用 人 机 交互 方式 , 将 网 络 外 包 任 
务 的 详细 信息 进行 分 解 并 依据 可 选择 提示 录入 至 系 
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统 , 保存 至 任务 数据 库 。 其 中 , “任务 类 型 "、“ 任 务 目 标 
及 产 出 成 果 ” 以 及 “执行 者 职能 ”以 选择 的 形式 录入 , 需 
要 根据 各 字段 所 记录 内 容 的 形式 来 确定 选项 来 源 ， 主 
要 依据 如 下 : 

(1) 任务 类 型 : 任务 可 以 按照 不 同 的 依据 进行 分 
类 ， 如 按照 行业 可 以 分 为 化 工 、 计 算 机 、 农 业 、 生 命 
科学 等 ; 按照 企业 解决 方案 分 为 一 般 的 企业 问题 解 
决 、 开 放 式 创新 的 速成 方法 与 实践 方案 和 企业 战略 咨 
询 ; 而 按照 学 科 门 类 的 分 类 则 相对 较 细 ， 而 且 涵盖 了 
许多 行业 分 类 的 信息 ， 有 助 于 分 析 网 络 外 包 任 务 的 专 
业 知 识 特征 , 是 本 文采 用 的 分 类 方法 。 

(2) 任务 目标 及 产 出 成 果 : 该 字段 记录 了 任务 产 
出 产品 的 形式 , 例如 流程 型 外 包 是 指 供 应 方 按 需求 完 
成 某 项 流程 , 产品 型 外 包 是 指 供应 方 需要 生产 一 个 最 
终 的 实物 产品 , 设计 型 外 包 是 指 供应 方 完成 某 项 需求 
的 设计 , 不 同 的 外 包 任 务 类 型 将 产生 不 同 的 产 出 产品 ， 
这 会 对 人 才 的 专业 选择 产生 影响 ; 因此 , 本 字段 的 选 
项 需要 结合 国内 成 熟 的 网 络 外 包 服 务 平 台 对 任务 输出 
形式 进行 标准 化 定义 。 

(3) 执行 者 职能 : 该 字段 记录 了 承 做 任务 的 执行 
者 的 应 当 具 备 的 能 力 , 这 通常 与 执行 者 在 工作 中 所 扮 
演 的 角色 相关 , 例如 计算 机 类 型 的 任务 对 执行 者 职能 
的 要 求 包括 在 软件 工程 师 、 网 站 运营 经 理 、 系 统管 理 员 
等 岗位 中 具备 经 验 的 人 才 ; 因此 本 字段 的 选项 需要 结 
合 权威 求职 网 站 对 于 人 才 岗 位 的 分 类 进行 规范 化 描述 。 

结合 上 述 依据 并 考虑 到 选项 来 源 的 权威 性 和 合理 
性 , 各 选项 的 来 源 归纳 如 表 2 所 示 : 

表 2 任务 描述 模型 的 各 选项 来 源 
任务 描述 主要 来 源 选项 示例 
我 国 最 新 版 本 的 《普通 高 
等 学 校本 科 专 业 目 录 和 专 
业 介 绍 》 和 《授予 博士 、 
人 硕士 学 位 和 培养 研究 生 的 


管理 学 科 : 信息 管理 、 
会 计 学 等 ; 计算 机 学 


科 : 计算 机 科学 与 技 


任务 类 型 


学 科 、 专 业 目 录 》 人 
任务 目标 及 机 区 关 闪 全 和 天 于 第 守 对 曲牌 设计 、 统 计 分 析 、 
多 全 六 让 必 钙 
产 出 成 果 。 夺 全 的 全 和 网 站 开发 等 
0 计算 机 类 : 软件 工程 
yas“ 前 程 无 忧 "” 求 职 网 站 中 。 Ta 人 
执行 者 职能 关于 职能 的 分 类 师 等 ; 会 计 类 : 财务 


分 析 员 等 
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通过 任务 发 布 形 式 与 数据 库 设 计 ， 系 统 以 半 结 构 
化 的 描述 模型 表示 网 络 化 外 包 任 务 的 详细 需求 信息 ， 
便于 进一步 对 任务 需求 进行 解析 。 

3.2 ”基于 规则 的 推理 

对 于 网 络 外 包 任 务 的 知识 需求 解析 来 说 , 需要 对 
任务 描述 模型 中 “任务 类 型 "、“ 任 务 目 标 及 产 出 成 果 ”、 
“执行 者 职能 ”三 部 分 通过 选项 录入 的 内 容 进 行 推 理解 
析 ， 找 出 其 对 应 的 知识 需求 。 

(1) 推理 解析 的 前 提 是 依据 相应 的 推理 规则 建立 
规则 库 。 本 研究 中 , 规则 库 的 知识 来 源 主 要 是 以 本 研 
究 团 队 前 期 通过 文本 挖掘 研究 并 构建 的 “学 科 -专业 - 
课程 知识 库 ” 和 “专业 技能 关联 知识 库 ” 为 基础 。 


其 中 ,“ 学 科 - 专 业 - 课 程 知识 库 ” 的 构建 是 基于 统 
计 分 析 的 方法 归纳 和 整理 各 专业 方向 下 各 高 校 开设 的 
共有 课程 ,并 结合 余弦 相似 度 算法 合并 授课 内 容 相似 
的 课程 ,建立 专业 和 课程 的 关联 关系 。 该 知识 库 结构 
和 关键 属性 如 图 2 所 示 : 


图 2 “学 科 - 专 业 - 课 程 知 识 库 ”结构 与 关键 属性 


而 “专业 技能 关联 知识 库 ” 的 构建 则 是 通过 文本 到 
类 的 方法 对 各 高 校 各 专业 的 培养 信息 文本 对 象 进行 分 
析 ， 按 照 不 同 专业 领域 进行 类 别 的 划分 , 并 基于 对 各 
聚 类 结果 特征 词 条 的 识别 归纳 每 个 专业 领域 类 别 中 的 
技能 指标 。 该 知识 库 结 构 和 关键 属性 如 图 3 所 示 : 


专业 领域 名 称 


图 3 “专业 技能 关联 知识 库 ” 结 构 与 关键 属性 


在 上 述 知识 库 的 基础 上 , 结合 人 工 智 能 领域 常用 
的 知识 表达 方式 一 一 产生 式 规则 表示 方法 建立 本 研究 
的 规则 库 071, 同一 条 件 下 如 对 应 多 个 规则 用 “and” 或 
“or” 连 接 : 

规则 库 Ri: 如 果 < 前 置 条 件 : 技能 > 则 < 后 置 条 件 : 专业 > 

规则 库 R?: 如 果 < 前 置 条 件 : 专业 > 则 < 后 置 条 件 : 课程 > 

(2) 结合 上 述 规则 库 ， 以 正 向 推理 作为 控制 策略 ， 
获取 推理 结果 , 正 向 推理 过 程 可 描述 如 下 : 


{ 
根据 需要 找到 可 用 规则 库 R; 
while “及 非 空 且 问题 未 求解 
begin 从 及 中 选择 一 条 规则 
证 该 规则 的 前 置 条 件 与 问题 相符 
then 将 该 规则 的 后 置 条 件 作 为 问题 的 解 
else ” 跳 向 下 一 条 规则 
End 


End 
} 


在 对 任务 描述 模型 进行 规则 推理 时 ,“ 任 务 类 型 ” 
与 “执行 者 职能 ”由 于 已 存储 任务 所 需 的 专业 信息 ,， 故 
只 需 调 用 规则 库 Rs, 而 “任务 目标 及 产 出 成 果 ”* 需 要 先 
后 调用 规则 库 R 和 了 ;分 两 步 推理 出 对 应 的 课程 需求 。 

(3) 对 上 述 任务 描述 模型 的 三 部 分 进行 基于 规则 
的 推理 后 ,获取 各 部 分 对 应 的 课程 知识 集合 ， 以 标准 
化 向 量 的 形式 量化 地 表达 任务 T 所 需要 的 课程 集合 
Cr， 如 下 所 示 : 


N N, Nk 


1 
k > » 
CT-1>N YN >Ni (W 
i=1 


i=] i=1 


其 中 , k 是 该 任务 所 需 课程 的 种 类 数 , Ni 表示 该 任 
务 对 于 第 i 种 课程 的 需求 次 数 。 对 于 该 课程 向 量 , 如 果 
其 中 某 项 值 较 大 , 说 明 任 务 对 于 该 课程 的 相关 程度 较 
大 ,从 而 学 过 该 课程 的 人 才 可 能 更 适应 这 项 任务 。 

3.3 ”基于 文本 分 析 的 解析 

尽管 通过 规则 推理 可 以 细 化 一 个 任务 的 课程 知识 
需求 , 但 现实 中 的 任务 仍然 十 分 复杂 , 需要 进一步 通 
过 文本 分 析 的 方法 对 “任务 内 容 描述 ”文本 进行 解析 ， 
与 规则 推理 互相 补充 。 

(1) 对 数据 库 中 的 “任务 内 容 描 述 " 文 本 以 及 “学 科 


Dhttp://www.sogou.com/labs/dl/w.html. 


-专业 -课程 知识 库 ” 中 的 课程 描述 文本 进行 分 词 处 理 ， 
分 词 算法 采用 正 向 最 大 匹配 法 (Forward Maximum 
Matching, FMM)， 中 文 语 料 词典 使 用 搜狗 互联 网 词 库 "， 
将 文本 对 象 划分 为 词语 、 词 组 的 集合 。 

(2) 进而 采用 向 量 空间 模型 (Vector Space Model， 
VSM) 这 一 最 常用 的 文本 的 数据 化 表示 方法 构建 文本 
对 象 的 数据 化 表示 模型 4， 即 任务 内 容 描述 与 课程 描 
述 文本 均 可 以 用 向 量 V(d)=(Ti,Wi; Ty,W; …; Ti Wa 
的 形式 表示 , 其 中 na 表 示 文 本 中 特征 词 的 总 数 , Tk 表 示 
第 k 个 特征 词 ，Wi 为 特征 词 Ty 所 对 应 的 权重 , 衡量 
该 特征 词 对 于 文本 d 的 重要 程度 。 特 征 词 权 重 的 计算 
方法 采用 TF-IDF 方法 W" 计算 公式 如 下 : 

Wi =TE; xIDE O) 

其 中 ，Wi 是 文本 d 的 向 量 中 词 条 Ti 的 权重 ，TEi 
是 词 条 Ti 在 文本 d 中 出 现 的 频率 , IDF; 是 包含 词 条 Ti 
的 文本 频率 的 倒数 。 用 向 量 中 权重 较 高 的 特征 词 表 示 
文本 的 特征 。 

(3) 采用 余弦 相似 度 公 式 对 任务 内 容 描述 文本 与 
课程 描述 文本 进行 相似 度 计 算 。 对 于 待 比较 的 目标 文 
本 , 求 出 特征 词 的 并 集 并 将 自己 文本 中 未 出 现 的 特征 
词 权 重 置 为 0, 得 到 任务 内 容 描 述 文本 癌 量 TT 与 课程 描 
述 文本 向 量 C;, 其 相似 度 计算 公式 如 下 : 


工 .C， 
Cos<T,Cj>= 一 人 (G3) 
TxIlC;ll 


该 值 越 接近 1, 说 明 任 务 与 对 应 课程 相似 度 也 越 
大 , 通过 将 任务 内 容 描述 与 所 有 课程 进行 相似 度 计算 ， 
可 以 得 到 相应 的 课程 向 量 。 以 标准 化 向 量 的 形式 量化 
地 表示 任务 T 与 n 门 课程 之 间 的 对 应 关系 Cr simi 为 
该 任务 与 第 i 门 课程 的 相似 度 , 计算 方法 如 下 : 


Siml sim> sim, 


| > i 
Cos > simi >》 simi >》 simi | 
1=] i=1 i=] 


3.4 任务 的 专业 背景 分 析 

在 通过 规则 推理 和 文本 分 析 的 解析 后 得 出 网 络 
外 包 任 务 的 课程 需求 向 量 , 可 以 解释 该 任务 对 于 各 类 
课程 的 需求 程度 。 在 此 基础 上 , 采用 任务 与 专业 相似 
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度 计算 的 方法 进一步 分 析 任 务 需 求 的 专业 背景 ,以 完 
善 任务 的 知识 需求 模型 。 

(1) 根据 “学 科 - 专 业 - 课 程 知识 库 ” 中 各 专业 所 对 
应 的 课程 , 结合 向 量 空间 模型 与 TF-IDF 算法 构造 各 
专业 的 课程 向 量 , 将 各 专业 表示 为 课程 及 其 权重 的 量 
化 形式 。 其 中 , 课程 的 权重 通过 设计 一 种 频繁 值 算法 
而 计算 得 出 , 该 算法 公式 如 下 : 

N 

[Cif Cw,C) fw,c),j=1,2.…,N] 

其 中 ,fw'Cj) 是 课程 词 条 w 在 相应 的 专业 Ci 中 的 
出 现 频率 , N 为 专业 总 数量 ，|{Cijlf(w,Ci) > 
f(w,C;),j=1,2,…,N}| 是 指 其 他 专业 中 w 的 频率 不 小 
于 在 专业 Ci 中 w 的 频率 的 所 有 专业 总 数 ， 通过 公式 
(5) 计 算得 出 的 数值 即 表示 课程 词 条 w 在 相应 专业 中 
的 重要 程度 。 

(2) 进而 将 规则 推理 和 文本 分 析 所 得 到 的 任务 课 
程 需 求 向 量 与 各 专业 课程 向 量 进行 结合 ,得 到 任务 与 
专业 之 间 的 相似 度 如 下 : 


simcM =(CT+CT) M (6) 


其 中 ，Cr 为 基于 规则 推理 得 到 的 课程 向 量 ，CT 为 
基于 文本 分 析 得 到 的 课程 向 量 ，M 为 某 专 业 的 课程 权 
重 向 量 。 通 过 计算 任务 与 各 个 专业 的 相似 度 ， 并 按照 
相似 度 从 高 到 低 为 专业 排序 ,可 以 得 到 与 该 任务 最 相 


Wi=f(w,Ci)xlog (5) 


表 3 任务 的 知识 需求 建 模 与 评估 结果 
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似 的 一 个 或 多 个 专业 。 该 分 析 结 果 可 以 用 来 对 任务 的 
专业 背景 进行 解释 , 说 明 哪 类 专业 下 的 人 才 最 能 够 胜 
任 该 任务 , 为 任务 的 课程 需求 做 出 补充 和 完善 。 
3.5 任务 知识 需求 模型 的 生成 

系统 基于 上 述 对 任务 的 分 析 处 理 结 果 , 自动 构建 
网 络 外 包 任 务 的 知识 需求 量化 模型 ， 并 将 结果 反馈 至 
人 机 交互 界面 供用 户 查 看 。 模 型 包括 任务 的 专业 背景 
和 相关 课程 需求 及 其 相应 的 需求 程度 ， 其 中 任务 的 课 
程 需 求 由 基于 规则 推理 的 课程 向 量 与 基于 文本 分 析 的 
课程 向 量 两 部 分 互相 补充 生成 。 

任务 的 知识 需求 模型 表明 能 够 完成 该 任务 的 人 才 
应 具备 的 专业 知识 背景 , 该 模型 的 建立 能 够 为 网 络 外 
包 模 式 下 任务 和 人 才 的 匹配 问题 提供 有 效 的 依据 和 
基础 。 


4 应 用 案例 与 分 析 


网 络 外 包 任 务 的 知识 需求 建 模 专 家 系统 原型 的 
实现 环境 为 Java 语言 下 的 Eclipse 平台 , 使 用 SQL 
Server 数据 库存 储 相 关 信 息 。 本 文选 取 “ 猪 八 戒 网 ”与 
“任务 中 国 ” 两 大 网 络 外 包 网 站 上 共 100 个 成 功 完成 的 
任务 作为 研究 对 象 , 使 用 系统 对 任务 的 知识 需求 进 
行 分 析 和 建 模 ,整体 样本 的 建 模 分 析 过 程 与 样本 任务 
“ 革 安 防 视频 系统 人 脸 识 别 算法 开发 ”的 分 析 结 果 示 
例如 表 3 所 示 : 


任务 的 知识 需求 建 模 步 又 项 100 个 样本 任务 


样本 任务 示例 “ 某 安防 视频 系统 人 脸 识别 算法 开发 ” 


规则 推理 : 任务 属性 课程 向 
文本 分 析 : 任务 描述 课程 向 
泛 专业 类 任务 

任务 专业 背景 分 析 普通 专业 类 任务 

精细 类 任务 

课程 需求 分 析 下 均值 =0.54 
专业 背景 分 析 均值 =0.68 


任务 课程 需求 向 量 分 析 


好 邮 


建 模 效果 评估 


规则 推理 : 数据 挖 气 等 
文本 分 析 : 计算 机 图 形 学 等 


计算 机 科学 、 软 件 工程 等 


课程 需求 分 析 下 值 =0.55 
专业 背景 分 析 下 值 =0.73 


4.1 任务 信息 录入 与 文本 分 词 

100 个 样本 任务 涉及 到 多 个 行业 和 类 型 , 通过 
专家 系统 原型 的 人 机 交互 界面 进行 任务 信息 的 录入 
和 描述 模型 构建 ， 并 对 “任务 内 容 描述 ”文本 内 容 进 
行 自动 分 词 处 理 。 以 “ 某 安防 视频 系统 人 脸 识别 算 
法 开发 ”任务 为 例 , 任务 信息 录入 与 分 词 过 程 如 图 
4 所 示 。 


现代 图 书 情报 技术 


4.2 ”任务 课程 需求 向 量 分 析 

通过 专家 系统 分 别 对 100 个 样本 任务 进行 规则 推 
理 和 文本 分 析 的 解析 ,最终 得 到 各 任务 的 课程 需求 向 
量 及 其 权重 。 样 本 任务 “ 某 安防 视频 系统 人 脸 识 别 算法 
开发 ”的 课程 需求 向 量 如 图 5 所 示 , 其 中 “任务 属性 课 
程 癌 量 ”为 规则 推理 结果 ,“ 任 务 描述 课程 向 量 ” 为 文本 
分 析 结 果 。 
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产品 选择 


型 于 渤 悍 行业 选择 和 
半天 2。 根据 系统 接口 编写 算法 代码 
日 计算 机 ,互联 网 通信 /电子 寻 
二 计算 机 硕 件 


ERP 实 施 顾 问 
ERP 技 术 开发 


根据 算法 需求 ， 设 计 识 别 算法 法 需求 设计 识别 


需求 : 

研究 非 爱 控 环 境 下 的 人 脸 识别 技术 ， 克 服 容 态 《 
Pose)， 光 上 照 (I1lumination) 和 表情 【 
Expression) 等 环境 因素 :简称 EIz) 的 影响 ; 提 | 照 ”影响 
高 人 脸 辨识 率 ， 光 其 是 插销 光照 的 影响 。 脸 标准 : 少 
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算法 系统 
代码 ”系统 对接 


与 系统 对 接 ， 进 行 测 试 进行 ”测试 需求 ”研究 非 ”爱护 


a 技术 ”克服 ”姿态 
环境 因素 简称 ) 

脸 ”辨识 京 尤其 是 抵消 

美国 ”标准 ”技术 局 


尽 可 能 


图 实 n 
根据 美国 标准 技术 局 (NIST) 推荐 的 人 脸 座 别 标准 ， 现 识 通过 ”计算 机 
尽 可 能 少 的 训练 图 像 实现 高 精度 识别 。 尽 可 能 实现 领域 ”图 维 海里 数据 能够 
一 像 训 别 【One Shot Face Recognition) 。 | 进行” 有效 地 识别 


通过 计算 机 视觉 领域 图 像 降 维 ， 在 海星 数据 下 也 能 况 


@IT. 管 理 讲 行 在 站 地 训 避 | 
到 电子 由 器 半导体 似 器 仪表 进行 有 效 地 识别 。 
会 计 丛 融 优 行 /保险 

呈 物 省 药 /化 工 


图 4 任务 信息 录入 与 分 词 过 


器 


IT 项 目 监理 03 
工 智 能 0.033890514 


并 行 计算 0.039428919 
软件 工程 0.039616756 
线性 代数 及 其 应 用 9 
积分 3 


42832575 


计 息 0 向 n_na2a32575 


任务 描述 课程 向 量 ， 
材料 力学 0， 

货币 金融 学 0.04 
计算 机 图 形 学 0.23 
计算 机 网络 0.09 
面向 对 象 程序 设计 0.03 
热能 动力 学 0.06 
软件 项 目 管理 0.1 
算法 导论 0.1 

通信 原理 0.22 

信号 与 系统 0.08| 


图 5 任务 课程 需求 向 量 示例 

4.3 任务 专业 背景 分 析 

在 对 所 有 样本 任务 解析 课程 需求 向 量 的 基础 上 ， 
系统 进一步 计算 和 归纳 各 任务 的 专业 背景 ,样本 任务 
“ 某 安防 视频 系统 人 脸 识别 算法 开发 ”的 专业 背景 分 析 
结果 为 计算 机 科学 、 软 件 工程 等 IT 类 相关 专业 。 

在 对 样本 任务 的 专业 背景 解析 过 程 中 发 现 ， 网 络 
外 包 任 务 根据 专业 背景 特点 的 差异 可 以 分 为 三 类 : 泛 
专业 类 任务 , 对 于 专业 的 需求 相对 分 散 和 简单 ， 如 宣 
传 口号 设计 、 数 据 收集 等 技术 含量 较 低 的 任务 ; 普通 
专业 类 任务 , 需求 较 明 显 地 偏向 于 某 几 个 专业 背景 ， 
如 网 站 设计 、 算 法 开发 等 综合 技术 型 任务 ; 精细 类 任 
务 ， 需 求 指向 某 一 个 特定 专业 ， 如 分 子 检测 、 细 胞 培养 
等 专业 性 极 强 的 任务 。 通 过 对 网 络 外 包 任 务 的 专业 青 
景 特征 进行 解析 和 分 类 ， 有 助 于 更 高 效 、 准 确 地 寻找 能 
够 胜任 的 人 才 ， 同 时 也 为 承接 任务 的 人 才 的 学 历 水 平 、 


程 示 例 


技术 能 力 等 其 他 要 素 提 出 了 更 具体 的 要 求 和 参考 。 
4.4 建 模 效果 评估 

在 对 100 个 样本 任务 分 别 构建 知识 需求 模型 后 ， 
得 到 每 个 任务 的 专业 背景 以 及 课程 需求 量化 模型 。 进 
一 步 对 实际 中 承接 任务 的 人 才 所 具备 的 专业 背景 和 所 
学 课程 进行 调研 和 验证 ,并 以 此 为 依据 , 采用 表示 信 
息 获 取 准 确 程度 的 准确 率 、 召 回 率 与 下 值 测度 来 评估 
专家 系统 建 模 的 效果 , 其 中 F 值 为 准确 率 与 召回 率 的 
调和 平均 值 P9， 数 值 在 0-1 之 间 且 越 高 越 好 。 建 模 评 
估 结 果 如 表 4 所 示 : 

表 4 任务 的 知识 需求 建 模 评估 结果 


F 值 取 值 范围 任务 的 课程 需求 任务 的 专业 背景 
一 0.5 12 组 5 组 
0.5-0.6 73 组 41 组 
0.6-0.7 12 组 38 组 
>0.7 3 组 16 组 
平均 F 值 0.54 0.68 


从 结果 可 以 看 出 ,代表 准确 程度 的 F 值 基本 都 大 
于 0.5, 且 平 均 F 值 处 于 较 高 水 平 ， 说 明 通 过 专家 系统 
解析 的 任务 知识 需求 与 实际 承接 任务 的 100 组 人 才 的 
专业 背景 、 所 学 课程 情况 比较 吻合 , 因此 本 研究 提出 
的 任务 知识 需求 模型 构建 方法 的 准确 性 和 有 效 性 得 到 
保障 ,同时 对 知识 的 需求 程度 具有 量化 的 效果 , 为 网 
络 外 包 的 任务 和 人 才 匹 配 打 下 基础 。 


S 结 语 
本 文 设计 专家 系统 框架 , 研究 建立 网 络 外 包 的 任 
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研究 文 


务 知 


识 需 求 模型 构建 方法 。 构 建 任务 的 描述 模型 ,在 


此 基础 上 分 别 基 于 推理 规则 和 文本 分 析 技 术 对 任务 进 
行 解 析 ， 以 量化 方式 获取 任务 的 课程 需求 向 量 ， 同 时 
结合 任务 的 专业 相似 度 构 建 网 络 外 包 任 务 的 知识 需求 


模型 。 并 通过 案例 验证 该 建 模 方法 具有 良好 的 效果 。 


本 文 所 提出 的 模型 构建 方法 还 有 竺 改进 之 处 ， 如 


对 于 推理 规则 的 自动 化 更 新 和 完善 方法 以 及 提升 文本 
分 析 算法 性 能 的 研究 等 。 这 些 问题 在 后 续 的 研究 中 都 
需要 进行 深入 探讨 。 
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Knowledge Requirement Model for Online Outsourcing Tasks 


Ma Tianyi Zhang Pengzhu Feng Haoyin 
(Antai College of Economics & Management, Shanghai Jiaotong University, Shanghai 200030, China) 


Abstract: [Objective] This study aims to build a knowledge requirement model for online outsourcing tasks. [Context] 
The proposed model could help us find proper personnel for each task. [Methods] We first designed an expert system 
framework and built a descriptive model for each task. And then, we analyzed the tasks based on inference rules and 
text analysis technology, with the purpose of quantifying the knowledge requirement for each task. [Results| The 
proposed framework successfully established the knowledge requirement model. [Conclusions] The new model laid 
foundation for the task-talent matching system of online outsourcing services. 


Keywords: Knowledge requirement Expertsystem Inferencerule Text analysis 
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